查看原文
其他

老姚专栏 | 别中伯克森悖论的“招”:从企业规模之争谈起

姚耀军 数据Seminar 2022-12-31

本文首发于澎湃商学院(2021-04-19)

原标题为《别中伯克森悖论的“招”:从企业规模之争谈起》


启研学社由知名学者担任学术顾问,高校师生与企研数据科学团队联合组建,以大数据资源及相关技术助力中国学术与智库研究为宗旨的研究组织。团队当前的主要目标是挖掘经济社会大数据资源在学术和智库领域的应用价值,开展学术大数据治理研究,以及探索大数据分析技术融入中国经济社会研究的可行进路。


 企业经济效益遭遇“规模诅咒”? 

“船大压风浪”,但“船小好调头”。


就经济效益而言,究竟是大企业更好还是小企业更好?学术界对此并无定论。总结起来,主要存在如下两种观点:

观点一认为,大企业的经济效益更好。


其理论基础,就是所谓的“规模经济”:随着企业规模的扩大,先进设备得以应用,专业分工更加明晰,分摊到每个产品上的固定成本越来越少,这些因素均会导致产品平均成本下降。

观点二认为,小企业的经济效益更好。


其理论基础自然是所谓的“规模不经济”:随着企业规模的扩大,管理层次增多,需引入更多的激励与监督机制,结果不仅增加了管理费用,而且导致企业决策变得更迟缓。

截然相反的两种观点孰对孰错?显然要靠证据说话。


最近,笔者评阅了一篇研究企业规模与经济效益关系的学术论文。基于某家商业银行历年的贷款客户数据,论文作者发现:企业规模越大,经济效益越低,两者呈现出负相关关系。这一研究结果被作者冠为“企业经济效益的‘规模诅咒’”,令人印象深刻。

或许只是一个统计学谬误。

那么,“规模诅咒”的研究结果是否很“靠谱”呢?


鉴于样本数据量相当大,答案似乎是肯定的。但笔者却认为,此研究结果或许只是一个统计学谬误。理由是,即便企业规模与经济效益在理论上没有任何关系,基于作者所利用的样本数据,我们仍有很大机会观察到,两者将呈现出负相关关系。

为便于进行具体的解释,在此我们不妨设想这样一种场景:


一个商业银行依据两种条件向企业授信,其中条件一是企业经济效益好,条件二是企业能够提供足够多的抵押品,而企业要获得贷款,须至少满足两个条件之一。


样本数据中的企业均为银行的贷款客户,根据上述场景就意味着:这些企业要么经济效益好,要么具有较大规模从而能够提供足够多的抵押品,要么既具有好的经济效益也具有较大的规模。


现在,我们首先考察样本数据中的小规模企业。既然有资格获得贷款,这些小规模企业的经济效益一定不错。我们再考察样本数据中的大规模企业。假设企业规模与经济效益在理论上无任何关系,那么平均而言,这些大规模企业的经济效益会处于中等水平。当然,根据上述银行授信条件,大规模企业的经济效益无论处于何种水平,均不会影响这些企业获得银行授信。


样本数据中的小规模企业具有好的经济效益,而大规模企业的经济效益平均而言却处于中等水平。因此,统计结果将显示:企业规模越大,经济效益通常越低。然而,这一负相关关系是虚假的——不要忘了,我们已经假设,企业规模与经济效益在理论上无任何关系!


“伯克森悖论”

上述统计结果,其实属于一个被称为“伯克森悖论”的统计学谬误。


此悖论的产生机制其实很简单,那就是:两个事件相互独立,但若这两个独立事件会产生共同结果,则给定共同结果,这两个事件就不再相互独立了。

一个例子:


例如,我们假定“天下雨”与“洒水车经过”是两个独立事件,而这两个事件会产生共同结果:马路湿了。现在给定“马路湿了”,那么洒水车未经过就意味着天下雨了。反之亦然,天未下雨就意味着洒水车经过了。


在经济效益好的企业或者大规模企业才能获得贷款的例子中,企业经济效益好与企业规模大会产生共同结果:被银行授信。以银行的贷款客户数据为样本,则相当于给定了“被银行授信”这一共同结果。此时,企业具有好的经济效益与企业具有较大规模这两个事件,即便在理论上是相互独立的,我们仍会从贷款客户数据中发现两者具有关联性。

“伯克森悖论”最早起源于生物统计学家约瑟夫·伯克森在1946年的发现。


工作于美国梅奥诊所的伯克森,对医院里的患者进行统计分析,结果发现:在患有糖尿病的人群中,同时患有胆囊炎的人占比较少;在未患糖尿病的人群中,患有胆囊炎的人占比较高。这似乎意味着,患上糖尿病可让病人免受胆囊炎的折磨,但从医学原理上看,这完全是无稽之谈。


伯克森敏锐地意识到,他遭遇了统计学谬误。为便于理解谬误何以产生,我们不妨设想世上只有糖尿病与胆囊炎这两种疾病。众所周知,患者并不一定会去医院看医生。但若分析对象是医院里的患者,则相当于给定了“患者去医院”这一共同结果。于是我们可推断:若患者未患糖尿病,则一定患有胆囊炎;若患者未患胆囊炎,则一定患有糖尿病。因此,即便这两种疾病在医学上毫无关系,但就医院里的患者而言,两种疾病看起来是存在关联的。


当然,世上并非只有糖尿病与胆囊炎这两种疾病,故基于对医院里患者的观察,我们仅能获得一个统计结论:糖尿病的患病率越高,胆囊炎的患病率通常越低。在医院里的患者身上,两种疾病的患病率呈现出负相关关系,然而这只是一种虚假的关系。

具有启发性的是,伯克森悖论可以解释不少日常生活现象。


例如,约会中的女生经常抱怨,帅哥往往高冷,而热情有余的男生往往颜值不咋地。基于伯克森悖论的一个解释是:只要女神们定下的约会条件是,对方要么是帅哥,要么是暖男,最好既帅又暖,那么给定“已经与她们约会”这一共同结果,她们就会观察到,男生颜值越高,通常显得越高冷,即便男生的颜值高低与其是否热情本不相干。


再如,教育经济学研究已经表明,良好的家庭经济条件有利于学生取得好成绩。然而,在观察留学生这类群体时,我们经常发现“寒门出贵子”,亦即学生的家庭经济条件与其成绩往往负相关。如何解释这种现象呢?我们知道,家庭经济条件不好的学生能出国留学,多半凭着成绩好能申请到奖学金。对于那些家庭经济条件好的学生,即使成绩不太好,但只要愿意承担昂贵的学费,他们也能出国留学。根据伯克森悖论,一旦给定“已经留学”这一共同结果,我们就会在符合共同结果的群体中,亦即留学生群体中,观察到家庭经济条件较差的学生通常具有较好成绩这种现象。


还有,在接触一些公司的员工后,我们经常产生这样的印象:“技术男”往往缺乏社交能力,而社交能力强者往往在专业技术能力上表现欠佳。基于伯克森悖论的一个解释是,即便一个人的专业技术能力与社交能力在理论上没有任何关系,但若专业技术能力强与社交能力强是公司招聘员工的两个条件,而成功的应聘者至少须满足两个条件之一,则基于对公司员工的观察,我们仍会发现,一个人的专业技术能力与社交能力显得难以两全。


最后,让我们回到笔者所评阅的以“规模诅咒”为主题的这篇实证研究论文。

从根源上看,这份研究之所以陷入了伯克森悖论,是因为作者利用了一个受到限制的样本。具体而言,那些规模较小同时经济效益差的企业,已被银行贷款客户数据系统性地遗漏了。实际上,任何有关伯克森悖论的现实例子,都可归因为观察结论来自于一个受到限制的样本。例如,样本或许遗漏了未去医院的患者、未入女神“法眼”的男生、未出国留学的学生、未在公司上班的人,等等。


伯克森悖论表明,对一个受到限制的样本进行观察,很容易以偏概全,产生误导性结论。因此,无论是在学术研究还是在日常生活中,我们都应警惕“眼见为实”的心态,要多想一想那些我们未看到但确实有可能发生的事情,以免中伯克森悖论的“招”。



企研数据创始学术顾问 · 耀军



姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授,博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,企研数据创始学术顾问。曾获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。研究领域:金融发展理论与实证、应用计量经济学。

邮箱:yaoyaojun@163.com

代表论文:

[1]姚耀军,施丹燕.互联网金融区域差异化发展的逻辑与检验——路径依赖与政府干预视角[J].金融研究,2017(05):127-142.

[2]姚耀军.制度质量对外资银行进入的影响——基于腐败控制维度的研究[J].金融研究,2016(03):124-139.

[3]姚耀军,董钢锋.中小企业融资约束缓解:金融发展水平重要抑或金融结构重要?-来自中小企业板上市公司的经验证据[J].金融研究,2015(04):148-161.





点击阅读原文进入CCAD数据库



·END·


星标⭐我们不迷路!

想要文章及时到,文末“在看”少不了!



点击搜索你感兴趣的内容吧


往期推荐


统计计量 | stata中双重差分操流程及代码

数据治理 | 经济分析

资讯 | 中国经济学年会成立13个专业委员会

数据资源 | Stata数据处理:通过API获取经济数据

资讯 | 世界经济学2019年最佳论文TOP10榜单

数据交流丨手把手教你获取联合国商品贸易统计数据,建议收藏!

软件应用 | 还不会用 Python 提取 PDF 表格?三种类型数据,轻松转换成 Excel







数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


文 | 姚耀军
排版编辑 | 青酱

    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存